标签【Pattern Recognition】

前言本系列教程基本就是摘抄《Python机器学习基础教程》中的例子内容。为了便于跟踪和学习，本系列教程在Github上提供了jupyter notebook 版本： Github仓库：htt ...

【album】语音分离技术

留坑概述微信公众号- 机器学习算法工程师：入门语音分离，从鸡尾酒问题开始！语音分离（Speech Separation），属于盲源分离问题，来自于“鸡尾酒会问题”。 ...

【librosa】音频特征提取

参考【librosa】及其在音频处理中的应用 librosa官方文档 liborosa源码 Overview: module code log-spectr ...

简称SD，顾名思义，在采集的语音信号流中，分辨出不同说话人的说话时长并标注，即以时间为索引，检测出每段语音所对应的说话人身份，其通常由说话人分割和聚类两步组成。参照2010年8月的文献[1]中的一 ...

前言用python实现了一个没有库依赖的“纯” py-based PrefixSpan算法。 Github 仓库 https://github.com/Holy-Shine/PrefixS ...

声纹识别（说话人识别）技术

说话人识别（Speaker Recognition，SR），又称声纹识别（Voiceprint Recognition,VPR），顾名思义，即通过声音来识别出来“谁在说话”。语音识别（Automati ...

引言感知实验表明，人耳对于声音信号的感知聚焦于某一特定频率区域内，而非在整个频谱包络中。耳蜗的滤波作用是在对数频率尺度进行的，在1000Hz以下为线性，在1000Hz以上为对数，这就使得人耳对低频 ...

使用深度学习模型时当然希望可以保存下训练好的模型，需要的时候直接调用，不再重新训练一、保存模型到本地以mnist数据集下的AutoEncoder 去噪为例。添加：这里的ten ...

VLAD / NetVLAD / GhostVLAD

部分参考：场景识别之NetVLAD 论文笔记：NetVLAD: CNN architecture for weakly supervised place recognition 论文阅读笔记-《Gh ...

第一种方法： Keras官方给的图片去噪示例要自动下载mnist数据集并处理，不能修改和加入自己的数据集。以上代码实现了把mnist数据集读到x_train 和x_test 中并且 ...